Trabajo final de ingeniería genética de microorganismosCaracterización de la secuencia 4 del cromosoma de Rhodoccocus sp.
R.Bayarri Olmos
Trabajo elaborado, poca bibliografía, la ORF elegida no es correcta
RESUMEN
En el presente trabajo se estudió una secuencia determinada de 17.000 pb del genoma de Rhodoccocus (los nombres de especies se subrayan o se escriben en cursiva) sp., y la caracterización de una de las proteínas codificadas en esa región. Tras esto, se realizó una mutación dirigida y la fusión a la proteína GFP , así como a un tag para facilitar su identificación.
INTRODUCCIÓN
El nombre del género Rhodococcus fue propuesto Goodfellow y Alderson (1) en un estudio de clasificación por taxonomía numérica. R. rhodochrous fue propuesto como la especie tipo. El género lo integran además ocho especies: R. bronchialis, R. coprophilus, R. corallinus, R. erythropolis, R. equi, R. rhodnii, R. ruber, R. rubropertinctus y R. terrae. Estas bacterias exhiben un amplio rango de actividades metabólicas (2). Tras un análisis bioinformático, fuimos descartando especies,hasta identificar nuestro microorganismo como R. sp.
MATERIALES Y MÉTODOS Cepas bacterianas y plásmidos
En este estudio hemos utilizado cepas de Rhodoccocus que crecimos a 28º en caldo de soja, en caldo de agar, o en "minimal salts thiamine medim",y cepas de E.Coli crecidas a 37ºC en caldo de Luria o en agar de luria.
Para realizar las mutaciones de nuestro gen, utilizamos el plásmido pBL1(referencia) al que introducimos el gen kan para seleccionar las colonias transformantes (pULRS6).(referencia) Obtención y cultivo de la cepa
Obtuvimos la cepa a partir de la toma de un elevado número de muestras de suelo el cauce del río bernesga (Bernesga) , y realizamos la selección en un medio sólido con vapores de una mezcla de hidrocarburos (si no dice algo en la introducción, no se entiende porque ha preparado ese medio) (hexano, heptano e iso-octano). Para el aislamiento se utilizó un medio con la siguiente composición: sulfato de magnesio 0,2 g, cloruro cálcico 0,02 g, fosfato monopotásico 1 g, fosfato dipotásico 1 g, nitrato amónico 1 g, cloruro férrico 0,05 g, agar-agar 15 g, y atmósfera de hexano:heptano:iso-octano (1:1:1) en bolsas de polipropileno herméticamente selladas. Con suficiente cantidad de oxígeno para desarrollo aeróbico (aproximadamente 200 ml). Análisis de datos Hemos llevado a cabo un seguimiento bioinformático de todas las etapas de nuestro experimento. Los diferentes programas utilizados serán explicados en sus correspondientes apartados.
PROCEDIMIENTO
La primera parte de nuestra investigación, consistió en idetificar la posición ocupada por nuestro microorganismo en árbol filogenético.
Primero aislamos el ADN tratando primro la pared con lisozima y SDS. A continuación, disociamos las proteínas del ADN con proteasas y agentEs coatrópics, procurando de no dañar nuestro ADN. Después de elimiar las proteínas y el ARN, concentramos el ADN.
A continuación, tomamos varias muestras del genoma de nuestro microorganismo, y realizamos PCR para coseguir sondas de ADN.
Con estas, utilizamos un microarray de ARNr de una gran variedad de microorganismos, con lo que conseguimos identificar el nuestro como Rhodoccocus sp. y establecer lasdistancias genéticas con las demás especies. (esto no se entiende, y no parece tenerlo claro)
1.- Microorganismo del cual procede la secuencia.
2.- Análisis informático de la secuencia mediante el programa ARTEMIS
Una vez identificada la posición filogenética ocupada por nuestro organismo, procedimos a analizar nuestra secuencia de 17.000 pb.
Comenzamos localizando los distintos ORFs con el programa Artemis, y analizándolos uno por uno mediante el programa blast del NCBI.
Los resultados fueron los siguientes:
45 ORFs en la cadena directa y 39 en la cadena inversa. De todos ellos, los siguientes tenían un prodecto génico identificado:
ORF 1
Localización (en bases): 2-3049
Codifica para: Glutamato sintasa subunidad grande y subunidad beta
ORF 2
Localización: 3773-4702
Codifica para: Subunidad pequeña de la glutamato sintasa
ORF 4
Localización: 12938-13741
Codifica para: Deshidogenasa putativa de unión al FAD /proteína hipotética
ORF 5
Localización: 12221-14437 en la cadena inversa
Codifica para: Un regulador transcripcional putativo de la familia TetR
ORF 6
Localización: 13949-14359
Codifica para: Regulador trascripcional en el microorganismo Saccharopolyspora erythraea
Este último ORF lo he tenido en cuenta debido a lo curioso de esa región, ya que presenta una gran homología con el gen de Saccharopolyspora pero, sin embargo, el programa blast no le encontró similitudes con ninguna región de Rhodoccocus .
De todos estos ORFs, seleccionamos el gen que puede codificar para la Deshidogenasa putativa de unión al FAD o para una proteína hipotética.
ORF 4:
Score = 606 bits (328), Expect = 2e-170
Identities = 668/825 (80%), Gaps = 51/825 (6%)
Strand=Plus/Minus
Secuencia de nucleótidos en formato FASTA:
GCGCTTTCCGGTGGCGTCGAGCCACAGCGACGACGGGCCGGGGATGATCCGGATGGCGTG
ATCGGGCCAGATCGGGTCCCAGTTGACGATGCCCTCGGTGTAGTGCCACATGCGATCCCG
GTTGACGATGTTGCCGCCCGCGTTCTCGGTGATCTCGAGCATGCGGCCGTCCACGTGCGC
GGGCACGCCGGTGATCATGTGCTCGGGCACACGGCCCAGGCGGTCGACGGGCCAGTTCTT
CTTCACGAGGTCGGGGTTGCCGCCGATGCCGCCGGAGGTCACCACCACGGCCTGCGCGCG
GAGTTCGAACTCGCCGACGGGCGTGCGGGACGACTTCACGCCGCGCGGTTCGGTCGACGG
CTCGAGCACCGTGCCGCGCACCCCCACGGCGGCGCCGTTCTCGACGATCAGATCGTCCAC
CTGGTGCCGGTATCGGAAGGTGACCTGTCCGCGGGCGGCGGCGTCGAGCACCGGTTCGCG
GAACACCCGGACCACTTCCGGTCCCGTGCCCCACGTGATGTGGAAGCGCGGTACCGAATT
TCCGTGACCGGTGGCCAGCCCACCGCCGCGTTCGGCCCAGCCGACGTTCGGCATCACGCG
CAGGCCGAGGTCGTGCAGGTAGGCCCGCTTCTCGCCGGCCGCGAAGTCGACGTAGGCCTC
GGCCCACTGCCGGGGCCAACGGTCTTCGCGGTCGCGGTCGAATCCGGCGCTGCCCAGCCA
GTCCTGCAGCGCCAGTTCACGGGAGTCCTTGATGCCCATGCGGCGCTGCTCGGGGCTGTC
CACCAGGAACAGGCCGCCGAGTGA Secuencia de aminoácidos en formato FASTA:
3.- Análisis del gen que codifica para la proteína elegida
Diseño de primers para la amplificación del gen/es por PCR
Realizamos los primers "manualmente" y luego comprobamos su validez mediante el programa Primer3 : Primer izquierdo5'-GCGCTTTCCGGTGGCGTC-3'
Primer derecho5'- TCACTCGGCGGCCTGTTCCT -3'
Al probarlos con el PRIMER3, nos dá un aviso de que no es recomendable el uso de estos 2 primers debido a que possen Tm demasiado altas y que el primer izq. tiene una alta estabilidad 3'. Después de probar todos los tamaños de primers posibles para amplificar la totalidad de la secuencia, escogimos la pareja con una Tm menor y más parecida y que no presentase complementariedad de bases.
Oligo
Comienzo
Longitud
Tm
%G+C
Auto complementariedad
3'
Secuencia
Primer izquierdo
1
18
69.68
72.22
4.00
2.00
GCGCTTTCCGGTGGCGTC
Primer derecho
804
20
69.75
69.75
5.00
0.00
TCACTCGGCGGCCTGTTCCT
Tamaño de la secuencia: 804 pb
Tamaño incluído entre los primers: 804pb
Complementariedad entre primers: 4.00
Complementariedad del extremo 3': 0.00
Si queremos estudiar el gen, podemos crear primers que incluyan puntos de corte para enzimas de restricción que también corten en el plásmido, de firma que lo podamos introducir y ver como se expresa en nuestro microorganismo:
Primer izquierdo: 5'- CCCAAGCTTGGG GCGCTTTCCGGTGGCGTC (HindIlI)
Primer derecho: 5'- CCCAAGCTTGGG TCACTCGGCGGCCTGTTCCT (HindIlI)
La enzima que reconoce la diana añadida al primer, no corta en el interior de nuestra secuencia, pero sí en el plásmido utilizado (pUL340, un vector de clonación en Corinebacterias).
Diseño de primers para amplificar fragmentos internos del gen/es y comprobar si dicho gen/es son esenciales o no para el microorganismo.
Volvemos a utilizar el programa Primer3 para diseñar primers, esta vez, que peritan amplifica secuencias internas:
Oligo
Comienzo
Longitud
Tm
%G+C
Auto complementariedad
3'
Secuencia
Primer izquierdo
230
20
58.99
55.00
4.00
2.00
GGCCAGTTCTTCTTCACGAG
Primer derecho
448
20
58.87
55.00
7.00
2.00
ACAGGTCACCTTCCGATACC
Tamaño amplificado: 214 pb
Esta es la pareja más favorable. El programa, además, te calcula otros primers que también pueden ser usados para amplificr fagmentos internos, pero de diferente tamaño. Por ejemplo:
Oligo
Comienzo
Longitud
Tm
%G+C
Auto complementariedad
3'
Secuencia
Primer izquierdo
69
19
59.91
57.89
5.00
2.00
AGATCGGGTCCCAGTTGAC
Primer derecho
254
20
58.84
55.00
4.00
0.00
CCGACCTCGTGAAGAAGAAC
Tamaño amplificado: 186 pb
Búsqueda informática de promotores, terminadores, secuencias señal…
Valiéndonos de distintas herramientas bioinformáticas, facilitadas por la Queen's university, analizamos la secuencia de nuestro gen, obteniendo la siguiente información:
Promotores
Score
Description
72
Position:
9
Strand:
+
Sequence:
GTGGCGTGCGCTTTCCG
Locus:
1
72
Position:
494
Strand:
-
Sequence:
GTGGTCCGGGTGTTCCG
Locus:
1
71
Position:
173
Strand:
-
Sequence:
GTGGACGGCCGCATGCT
Locus:
1
71
Position:
635
Strand:
+
Sequence:
TAGGCCCGCTTCTCGCC
Locus:
1
70
Position:
536
Strand:
-
Sequence:
TCGGTACCGCGCTTCCA
Locus:
1
69
Position:
234
Strand:
-
Sequence:
CTGGCCCGTCGACCGCC
Locus:
1
69
Position:
376
Strand:
-
Sequence:
GCGGCACGGTGCTCGAG
Locus:
1
69
Position:
616
Strand:
+
Sequence:
CAGGCCGAGGTCGTGCA
Locus:
1
Tuvimos que disminuir manualmente la precisión del análisis , y escogimos un valor límite de 69, ya que a partir de él, se producía una caída drástica de la puntuación de los posibles promotores.
El programa utilizado fue el PromScan. Al cotejar los resultados con el programa BProm de Softberry, en el cual no te deja ajustar su precisión y especifidad (por defecto, el 80%), no encontramos promotores.
De todos ellos, nos quedaríamos con el promotor de la primera posición (9), y a lo sumo, con el que ocupa la posicion 173. Debería haber señalado en la secuencia dónde se encuentra el promotor
Terminadores
Para al búsqueda bioinformática de terminadores, utilizamos el programa TransTermHP, que realiza predicciones sobre la localización de terminadores en los microorganismos de su base de datos. Debido a que el genoma de Rhodococcus no está disponible para realizar el estudio de terminadores (eso no es una excusa, el terminador se encuentra en la secuencia que le he proporcionado, o no ha entendido el concepto) , utilizamos el microorganismo más próximo fiogeneticamente, Nocardia farcinina y utilizamos sus datos.
Debido a que no disponíamos de mejores herramientas, tuvimos que realizar la búsqueda manual de los terminadores en la secuencia pra nuestra proteína, pero no obtuvimos ningún resultado favorable.
4.- Análisis de la/s proteína/s elegida/s
Diseño de primers para amplificar los genes que codifican para la proteína de interés con colas de histidina para su rápida purificación
Introduciremos nuestro Tag en el extremo 5' de la proteína:
Primer izquierdo: 5'- CCCAAGCTTGGG ATG CGCCGCCGCCGCCGCCGC GCGCTTTCCGGTGGCGTC
Primer derecho: 5'- CCCAAGCTTGGG TCACTCGGCGGCCTGTTCCT
En el primer izquierdo hemos introducido el codón de inicio antes de la secuencia que codifica para His6 (una cola de 6 residuos de histidina), en color azul.
Para el primer derecho hemos respetado su estructura, sin añadirle ningún codón de terminación, pues ya viene en nuestra proteína.
Hemos utilizado las sec. diana de la enzima HindIII, que sólo posee un sitio de corte en el plásmido (lugar en el que se insertará nuestra construcción), por lo que podremos hacer un screening rápido de nuestro gen.
Estudio de la proteína por bioinformática (dominios conservados, hidrofobicidad, estructura, características bioquímicas…..)
Características fisico-químicas
Número de aminoácidos: 267 Peso molecular: 27668.7 PI: 5.82 Composición de aminoácidos:
Ala (A) 43 16.1%
Arg (R) 22 8.2%
Asn (N) 0 0.0%
Asp (D) 21 7.9%
Cys (C) 0 0.0%
Gln (Q) 11 4.1%
Glu (E) 15 5.6%
Gly (G) 35 13.1%
His (H) 22 8.2%
Ile (I) 4 1.5%
Leu (L) 22 8.2%
Lys (K) 0 0.0%
Met (M) 0 0.0%
Phe (F) 7 2.6%
Pro (P) 18 6.7%
Ser (S) 6 2.2%
Thr (T) 5 1.9%
Trp (W) 0 0.0%
Tyr (Y) 1 0.4%
Val (V) 35 13.1%
Pyl (O) 0 0.0%
Sec (U) 0 0.0%
(B) 0 0.0%
(Z) 0 0.0%
(X) 0 0.0%
Número total de residuos cargados negativamente (Asp+Glu): 36 Número total de residuos cargados positivamente (Arg+Lys): 22
Composición atómica:
Carbon C 1208
Hydrogen H 1902
Nitrogen N 388
Oxygen O 363
Sulfur S 0
Coeficiente de extinción: 1490 (medido a 280nm en agua).
Esta proteína no contiene residuos Trp, lo que puede llevar a un error de más del 10% en el cálculo del coeficiente de extinción (M-1 cm-1).
Abs 0.1% (=1 g/l) 0.054, assuming ALL Cys residues appear as half cystines
Vida media estimada: 4.4 horas (reticulocitos in vitro).
>20 horas (levaduras, in vivo).
>10 horas (Escherichia coli, in vivo).
Índice de inestabilidad: 25.50
Con este valor, consideramos la proteína como estable.
Índice alifático: 92.10
Motivos de la proteína (despues de todo esto, qué conclusión saca de esta proteína?)
El programa motifScan nos permite acceder a distintas bases de datos desde las que identificar los diferentes motivos de nuestra proteína.
Los distintos motivos quedan recogidos en el siguiente mapa:
A continuación, se encuentra una vista más detallada de los mismos. El orden se corresponde con el mostrado en el mapa.
Hidrofobicidad
Para calcular este parámetro, utilizamos el programa Protscale., el cual te permite calclar y representar el perfil producido por cualquier "escala de aminoácidos" en la proteína seleccionada. Una escala de aminoácido se define por un valor numérico asignado a cada aminoácido. En nuestro caso, utilizamos la escala de hidrofobicidad de Kyte & Doolittle.
Los valores de los aminoácidos son los que siguen:
Reprentación de la escala de hidrofobicidad de Kyte & Doolittle:
Familia
Según de que fuente obtengamos la secuencia, el programa Pfam nos da un resultado u otro. Con la secuancia de aminoácidos obtenida con el ARTEMIS, el Pfam no encuentra ninguna familia (eso es la prueba de que no ha utilizado bien Arttemis y ha elegido un ORF no correcto) . Si tomamos el prouct génico desde lso resultados del ncbi, obtenemos que pertenece a la "FAD binding domain".
Esta familia incluye las subunidades flavoproteina de las fumarato y succinato deshidrogenasa, aspartato oxidasa y la subunidad alfa de la adenililsulfato reductasa.
En bacterias hay 2 grupos diferenciados; proteínas unidas a membrana y complejos enzimaticos responsables de la interconversión de fumarato y succinato: fumarato reductasa (Frd), usada en el crecimiento anaeróbico, y la succinato deshidrogenasa (Sdh), usada en el crecimiento aeróbico. Ambos complejos están formados por dos componentes principales: un componente extrínseco de membrana, compuesto por una flavoproteína de unión al FAD y un proteína de hierro-azufre; y un componente hidrofóbico compuesto de una proteína de anclaje a la membrana y/o un citocromo B.
La subunidad flavoproteína es una proteina de unos 60 a 70 kd, en la cual el FADestá unido covalentmente a un residuo de histidina localizado en la sección N-terminal de la proteína PUBMED:2668268.La secuencia de los alrededores de la histidina esá bien conservada en Frd y Sdh en numerosas especias bacterianas y eucariotas PUBMED:1375942.
Esta familia es miembro del clan NADP_Rossmann (CL0063).
Localización celular
Para localizar nuestra proteína utilizamos el programa PsortB, obteniendo que es una proteína citoplasmática:
Localization Scores: Cytoplasmic 8.87
CytoplasmicMembrane 0.39
Cellwall 0.01
Extracellular 0.73
Debido a sólo ha podido encontrar unas pocas regiones identificativas de la posición en nuestra secuencia, comprobaremos los resultados buscando posibles péptidos señal y dominios trasmembrana:
Péptido señal
El análisis lo hemos realizado online con el Signal 3.0. La primer gráfica corresponde a un análisis de "neural networks" (NN), y la segunda a "hidden Markov models" (HMM):
Dominios transmembrana
Como podíamos esperar, después de realizar el análisis, comprobamos que no posee dominios transmembrana, por lo que afirmamos que se trata de una proteína citoplasmática.
Mutagénesis in vitro del gen que codifica para la proteína elegida.
GCGCTTTCCGGTGGCGTCGAGCCACAGCGACGACGGGCCGGGGATGATCCGGATGGCGTG CGCGAAAGGCCACCGCAGCTCGGTGTCGCTGCTGCCCGGCCCCTACTAGGCCTACCGCAC ATCGGGCCAGATCGGGTCCCAGTTGACGATGCCCTCGGTGTAGTGCCACATGCGATCCCG
TAGCCCGGTCTAGCCCAGGGTCAACTGCTACGGGAGCCACATCACGGTGTACGCTAGGGC GTTGACGATGTTGCCGCCCGCGTTCTCGGTGATCTCGAGCATGCGGCCGTCCACGTGCGC
CAACTGCTACAACGGCGGGCGCAAGAGCCACTAGAGCTCGTACGCCGGCAGGTGCACGCG GGGCACGCCGGTGATCATGTGCTCGGGCACACGGCCCAGGCGGTCGACGGGCCAGTTCTT
CCCGTGCGGCCACTAGTACACGAGCCCGTGTGCCGGGTCCGCCAGCTGCCCGGTCAAGAA CTTCACGAGGTCGGGGTTGCCGCCGATGCCGCCGGAGGTCACCACCACGGCCTGCGCGCG GAAGTGCTCCAGCCCCAACGGCGGCTACGGCGGCCTCCAGTGGTGGTGCCGGACGCGCGC GAGTTCGAACTCGCCGACGGGCGTGCGGGACGACTTCACGCCGCGCGGTTCGGTCGACGG
CTCAAGCTTGAGCGGCTGCCCGCACGCCCTGCTGAAGTGCGGCGCGCCAAGCCAGCTGCC CTCGAGCACCGTGCCGCGCACCCCCACGGCGGCGCCGTTCTCGACGATCAGATCGTCCAC
GAGCTCGTGGCACGGCGCGTGGGGGTGCCGCCGCGGCAAGAGCTGCTAGTCTAGCAGGTG CTGGTGCCGGTATCGGAAGGTGACCTGTCCGCGGGCGGCGGCGTCGAGCACCGGTTCGCG
GACCACGGCCATAGCCTTCCACTGGACAGGCGCCCGCCGCCGCAGCTCGTGGCCAAGCGC GAACACCCGGACCACTTCCGGTCCCGTGCCCCACGTGATGTGGAAGCGCGGTACCGAATT
CTTGTGGGCCTGGTGAAGGCCAGGGCACGGGGTGCACTACACCTTCGCGCCATGGCTTAA TCCGTGACCGGTGGCCAGCCCACCGCCGCGTTCGGCCCAGCCGACGTTCGGCATCACGCG
AGGCACTGGCCACCGGTCGGGTGGCGGCGCAAGCCGGGTCGGCTGCAAGCCGTAGTGCGC CAGGCCGAGGTCGTGCAGGTAGGCCCGCTTCTCGCCGGCCGCGAAGTCGACGTAGGCCTC
GTCCGGCTCCAGCACGTCCATCCGGGCGAAGAGCGGCCGGCGCTTCAGCTGCATCCGGAG GGCCCACTGCCGGGGCCAACGGTCTTCGCGGTCGCGGTCGAATCCGGCGCTGCCCAGCCA
CCGGGTGACGGCCCCGGTTGCCAGAAGCGCCAGCGCCAGCTTAGGCCGCGACGGGTCGGT GTCCTGCAGCGCCAGTTCACGGGAGTCCTTGATGCCCATGCGGCGCTGCTCGGGGCTGTC
CAGGACGTCGCGGTCAAGTGCCCTCAGGAACTACGGGTACGCCGCGACGAGCCCCGACAG CACCAGGAACAGGCCGCCGAGTGA
GTGGTCCTTGTCCGGCGGCTCACT
Primer 1: GCGCTTTCCGGTGGCGTC
Primer 2: GGCCACTTCTTCTTCACGAG
Primer 3: CTCGTGAAGAAGAAGTGGCC
Primer 4: TCACTCGGCGGCCTGTTCCT
Realizamos la mutación en el codón GTT, que codifica para el aminoácido alifático Valina, sustituyendo la G por la C, por lo que ahora pasará a codificar para la leucina, otro aminoacido alifático. Hemos realizado una mutación conservativa utilizando primers que presentan "missmatch".
Diseño de primers para realizar fusiones génicas entre la proteína de interés con la proteína fluorescente verde para estudiar su localización celular o su concentración a lo largo del crecimiento del microorganismo.
Secuencia del gen GFP ATGAGTAAAGGAGAAGAACTTTTCACTGGAGTTGTCCCAATTCTTGTTGAATTAGATGGTGATGTTAATG 0 TACTCATTTCCTCTTCTTGAAAAGTGACCTCAACAGGGTTAAGAACAACTTAATCTACCACTACAATTAC 0
Primer derecho: 5'- CCCAAGCTTGGG TCACTCGGCGGCCTGTTCCT (HindIlI)
Primer 1: 5'- CCCAAGCTTGGG ATG GCGCTTTCCGGTGGCGTC
Primer 2: 5'- CTCCTTTACTCATCTCGGCGGCC
Primer 3: 5'- GGCCGCCGAGATGAGTAAAGGAG
Primer 4: 5'- AACTGCAGAACCAATGCATTGG AATAAACATATCAAGTAGGTACGG (PstI)
Nota: Las dianas de las enzimas de restricción se encuentras subrayadas y flanqueadas por las bases necesarias para que se produca el corte.
BIBLIOGRAFIA(no se puede escribir un trabajo en el 2009 usando una bibliografía anticuada) No ha utilizado los programas indicados para la bibliografía.
1. Goodfellow M, Alderson G (1977) The actinomycete-genus Rhodococcus: a home for the 'rhodochrous' complex. J. Gen. Microbiol. 100: 99-122.
2. Warhurst AM, Fewson CA (1994) Biotransformations catalyzed bythe genus hodococcus. Crit. Rev. Biotechnol. 14: 29-73.
Trabajo final de ingeniería genética de microorganismosCaracterización de la secuencia 4 del cromosoma de Rhodoccocus sp.
R.Bayarri OlmosTrabajo elaborado, poca bibliografía, la ORF elegida no es correcta
RESUMEN
En el presente trabajo se estudió una secuencia determinada de 17.000 pb del genoma de Rhodoccocus (los nombres de especies se subrayan o se escriben en cursiva) sp., y la caracterización de una de las proteínas codificadas en esa región. Tras esto, se realizó una mutación dirigida y la fusión a la proteína GFP , así como a un tag para facilitar su identificación.
INTRODUCCIÓN
El nombre del género Rhodococcus fue propuesto Goodfellow y Alderson (1) en un estudio de clasificación por taxonomía numérica. R. rhodochrous fue propuesto como la especie tipo. El género lo integran además ocho especies: R. bronchialis, R. coprophilus, R. corallinus, R. erythropolis, R. equi, R. rhodnii, R. ruber, R. rubropertinctus y R. terrae. Estas bacterias exhiben un amplio rango de actividades metabólicas (2). Tras un análisis bioinformático, fuimos descartando especies,hasta identificar nuestro microorganismo como R. sp.
MATERIALES Y MÉTODOS
Cepas bacterianas y plásmidos
En este estudio hemos utilizado cepas de Rhodoccocus que crecimos a 28º en caldo de soja, en caldo de agar, o en "minimal salts thiamine medim",y cepas de E.Coli crecidas a 37ºC en caldo de Luria o en agar de luria.
Para realizar las mutaciones de nuestro gen, utilizamos el plásmido pBL1(referencia) al que introducimos el gen kan para seleccionar las colonias transformantes (pULRS6).(referencia)
Obtención y cultivo de la cepa
Obtuvimos la cepa a partir de la toma de un elevado número de muestras de suelo el cauce del río bernesga (Bernesga) , y realizamos la selección en un medio sólido con vapores de una mezcla de hidrocarburos (si no dice algo en la introducción, no se entiende porque ha preparado ese medio) (hexano, heptano e iso-octano). Para el aislamiento se utilizó un medio con la siguiente composición: sulfato de magnesio 0,2 g, cloruro cálcico 0,02 g, fosfato monopotásico 1 g, fosfato dipotásico 1 g, nitrato amónico 1 g, cloruro férrico 0,05 g, agar-agar 15 g, y atmósfera de hexano:heptano:iso-octano (1:1:1) en bolsas de polipropileno herméticamente selladas. Con suficiente cantidad de oxígeno para desarrollo aeróbico (aproximadamente 200 ml).
Análisis de datos Hemos llevado a cabo un seguimiento bioinformático de todas las etapas de nuestro experimento. Los diferentes programas utilizados serán explicados en sus correspondientes apartados.
PROCEDIMIENTO
La primera parte de nuestra investigación, consistió en idetificar la posición ocupada por nuestro microorganismo en árbol filogenético.
Primero aislamos el ADN tratando primro la pared con lisozima y SDS. A continuación, disociamos las proteínas del ADN con proteasas y agentEs coatrópics, procurando de no dañar nuestro ADN. Después de elimiar las proteínas y el ARN, concentramos el ADN.
A continuación, tomamos varias muestras del genoma de nuestro microorganismo, y realizamos PCR para coseguir sondas de ADN.
Con estas, utilizamos un microarray de ARNr de una gran variedad de microorganismos, con lo que conseguimos identificar el nuestro como Rhodoccocus sp. y establecer lasdistancias genéticas con las demás especies. (esto no se entiende, y no parece tenerlo claro)
1.- Microorganismo del cual procede la secuencia.
2.- Análisis informático de la secuencia mediante el programa ARTEMIS
Una vez identificada la posición filogenética ocupada por nuestro organismo, procedimos a analizar nuestra secuencia de 17.000 pb.Comenzamos localizando los distintos ORFs con el programa Artemis, y analizándolos uno por uno mediante el programa blast del NCBI.
Los resultados fueron los siguientes:
45 ORFs en la cadena directa y 39 en la cadena inversa. De todos ellos, los siguientes tenían un prodecto génico identificado:
ORF 1
Localización (en bases): 2-3049
Codifica para: Glutamato sintasa subunidad grande y subunidad beta
ORF 2
Localización: 3773-4702
Codifica para: Subunidad pequeña de la glutamato sintasa
ORF 3
Localización: 12062-12937
Codifica para: Proteína hipotética
ORF 4
Localización: 12938-13741
Codifica para: Deshidogenasa putativa de unión al FAD /proteína hipotética
ORF 5
Localización: 12221-14437 en la cadena inversa
Codifica para: Un regulador transcripcional putativo de la familia TetR
ORF 6
Localización: 13949-14359
Codifica para: Regulador trascripcional en el microorganismo Saccharopolyspora erythraea
Este último ORF lo he tenido en cuenta debido a lo curioso de esa región, ya que presenta una gran homología con el gen de Saccharopolyspora pero, sin embargo, el programa blast no le encontró similitudes con ninguna región de Rhodoccocus .
De todos estos ORFs, seleccionamos el gen que puede codificar para la Deshidogenasa putativa de unión al FAD o para una proteína hipotética.
ORF 4:
Score = 606 bits (328), Expect = 2e-170
Identities = 668/825 (80%), Gaps = 51/825 (6%)
Strand=Plus/Minus
Secuencia de nucleótidos en formato FASTA:
GCGCTTTCCGGTGGCGTCGAGCCACAGCGACGACGGGCCGGGGATGATCCGGATGGCGTG
ATCGGGCCAGATCGGGTCCCAGTTGACGATGCCCTCGGTGTAGTGCCACATGCGATCCCG
GTTGACGATGTTGCCGCCCGCGTTCTCGGTGATCTCGAGCATGCGGCCGTCCACGTGCGC
GGGCACGCCGGTGATCATGTGCTCGGGCACACGGCCCAGGCGGTCGACGGGCCAGTTCTT
CTTCACGAGGTCGGGGTTGCCGCCGATGCCGCCGGAGGTCACCACCACGGCCTGCGCGCG
GAGTTCGAACTCGCCGACGGGCGTGCGGGACGACTTCACGCCGCGCGGTTCGGTCGACGG
CTCGAGCACCGTGCCGCGCACCCCCACGGCGGCGCCGTTCTCGACGATCAGATCGTCCAC
CTGGTGCCGGTATCGGAAGGTGACCTGTCCGCGGGCGGCGGCGTCGAGCACCGGTTCGCG
GAACACCCGGACCACTTCCGGTCCCGTGCCCCACGTGATGTGGAAGCGCGGTACCGAATT
TCCGTGACCGGTGGCCAGCCCACCGCCGCGTTCGGCCCAGCCGACGTTCGGCATCACGCG
CAGGCCGAGGTCGTGCAGGTAGGCCCGCTTCTCGCCGGCCGCGAAGTCGACGTAGGCCTC
GGCCCACTGCCGGGGCCAACGGTCTTCGCGGTCGCGGTCGAATCCGGCGCTGCCCAGCCA
GTCCTGCAGCGCCAGTTCACGGGAGTCCTTGATGCCCATGCGGCGCTGCTCGGGGCTGTC
CACCAGGAACAGGCCGCCGAGTGA
Secuencia de aminoácidos en formato FASTA:
Esta ORF no está bien analizada. REQ530
ALSGGVEPQRRRAGDDPDGVIGPDRVPVDDALGVVPHAIPVDDVAARVLGDLEHAAVHVR
GHAGDHVLGHTAQAVDGPVLLHEVGVAADAAGGHHHGLRAEFELADGRAGRLHAARFGRR
LEHRAAHPHGGAVLDDQIVHLVPVSEGDLSAGGGVEHRFAEHPDHFRSRAPRDVEARYRI
SVTGGQPTAAFGPADVRHHAQAEVVQVGPLLAGREVDVGLGPLPGPTVFAVAVESGAAQP
VLQRQFTGVLDAHAALLGAVHQEQAAE
3.- Análisis del gen que codifica para la proteína elegida
Diseño de primers para la amplificación del gen/es por PCR
Realizamos los primers "manualmente" y luego comprobamos su validez mediante el programa Primer3 :
Primer izquierdo 5'-GCGCTTTCCGGTGGCGTC-3'
Primer derecho 5'- TCACTCGGCGGCCTGTTCCT -3'
Al probarlos con el PRIMER3, nos dá un aviso de que no es recomendable el uso de estos 2 primers debido a que possen Tm demasiado altas y que el primer izq. tiene una alta estabilidad 3'. Después de probar todos los tamaños de primers posibles para amplificar la totalidad de la secuencia, escogimos la pareja con una Tm menor y más parecida y que no presentase complementariedad de bases.
Tamaño incluído entre los primers: 804pb
Complementariedad entre primers: 4.00
Complementariedad del extremo 3': 0.00
Si queremos estudiar el gen, podemos crear primers que incluyan puntos de corte para enzimas de restricción que también corten en el plásmido, de firma que lo podamos introducir y ver como se expresa en nuestro microorganismo:
Primer izquierdo: 5'- CCCAAGCTTGGG GCGCTTTCCGGTGGCGTC (HindIlI)
Primer derecho: 5'- CCCAAGCTTGGG TCACTCGGCGGCCTGTTCCT (HindIlI)
La enzima que reconoce la diana añadida al primer, no corta en el interior de nuestra secuencia, pero sí en el plásmido utilizado (pUL340, un vector de clonación en Corinebacterias).
Diseño de primers para amplificar fragmentos internos del gen/es y comprobar si dicho gen/es son esenciales o no para el microorganismo.
Volvemos a utilizar el programa Primer3 para diseñar primers, esta vez, que peritan amplifica secuencias internas:
Esta es la pareja más favorable. El programa, además, te calcula otros primers que también pueden ser usados para amplificr fagmentos internos, pero de diferente tamaño. Por ejemplo:
Búsqueda informática de promotores, terminadores, secuencias señal…
Valiéndonos de distintas herramientas bioinformáticas, facilitadas por la Queen's university, analizamos la secuencia de nuestro gen, obteniendo la siguiente información:
Promotores
El programa utilizado fue el PromScan. Al cotejar los resultados con el programa BProm de Softberry, en el cual no te deja ajustar su precisión y especifidad (por defecto, el 80%), no encontramos promotores.
De todos ellos, nos quedaríamos con el promotor de la primera posición (9), y a lo sumo, con el que ocupa la posicion 173.
Debería haber señalado en la secuencia dónde se encuentra el promotor
Terminadores
Para al búsqueda bioinformática de terminadores, utilizamos el programa TransTermHP, que realiza predicciones sobre la localización de terminadores en los microorganismos de su base de datos. Debido a que el genoma de Rhodococcus no está disponible para realizar el estudio de terminadores (eso no es una excusa, el terminador se encuentra en la secuencia que le he proporcionado, o no ha entendido el concepto) , utilizamos el microorganismo más próximo fiogeneticamente, Nocardia farcinina y utilizamos sus datos.
Debido a que no disponíamos de mejores herramientas, tuvimos que realizar la búsqueda manual de los terminadores en la secuencia pra nuestra proteína, pero no obtuvimos ningún resultado favorable.
4.- Análisis de la/s proteína/s elegida/s
Diseño de primers para amplificar los genes que codifican para la proteína de interés con colas de histidina para su rápida purificación
Introduciremos nuestro Tag en el extremo 5' de la proteína:Primer izquierdo: 5'- CCCAAGCTTGGG ATG CGCCGCCGCCGCCGCCGC GCGCTTTCCGGTGGCGTC
Primer derecho: 5'- CCCAAGCTTGGG TCACTCGGCGGCCTGTTCCT
En el primer izquierdo hemos introducido el codón de inicio antes de la secuencia que codifica para His6 (una cola de 6 residuos de histidina), en color azul.
Para el primer derecho hemos respetado su estructura, sin añadirle ningún codón de terminación, pues ya viene en nuestra proteína.
Hemos utilizado las sec. diana de la enzima HindIII, que sólo posee un sitio de corte en el plásmido (lugar en el que se insertará nuestra construcción), por lo que podremos hacer un screening rápido de nuestro gen.
Estudio de la proteína por bioinformática (dominios conservados, hidrofobicidad, estructura, características bioquímicas…..)
Características fisico-químicas
Número de aminoácidos: 267
Peso molecular: 27668.7
PI: 5.82
Composición de aminoácidos:
Ala (A) 43 16.1%
Arg (R) 22 8.2%
Asn (N) 0 0.0%
Asp (D) 21 7.9%
Cys (C) 0 0.0%
Gln (Q) 11 4.1%
Glu (E) 15 5.6%
Gly (G) 35 13.1%
His (H) 22 8.2%
Ile (I) 4 1.5%
Leu (L) 22 8.2%
Lys (K) 0 0.0%
Met (M) 0 0.0%
Phe (F) 7 2.6%
Pro (P) 18 6.7%
Ser (S) 6 2.2%
Thr (T) 5 1.9%
Trp (W) 0 0.0%
Tyr (Y) 1 0.4%
Val (V) 35 13.1%
Pyl (O) 0 0.0%
Sec (U) 0 0.0%
(B) 0 0.0%
(Z) 0 0.0%
(X) 0 0.0%
Número total de residuos cargados negativamente (Asp+Glu): 36
Número total de residuos cargados positivamente (Arg+Lys): 22
Composición atómica:
Carbon C 1208
Hydrogen H 1902
Nitrogen N 388
Oxygen O 363
Sulfur S 0
Coeficiente de extinción: 1490 (medido a 280nm en agua).
Esta proteína no contiene residuos Trp, lo que puede llevar a un error de más del 10% en el cálculo del coeficiente de extinción (M-1 cm-1).
Abs 0.1% (=1 g/l) 0.054, assuming ALL Cys residues appear as half cystines
Vida media estimada: 4.4 horas (reticulocitos in vitro).
>20 horas (levaduras, in vivo).
>10 horas (Escherichia coli, in vivo).
Índice de inestabilidad: 25.50
Con este valor, consideramos la proteína como estable.
Índice alifático: 92.10
Motivos de la proteína (despues de todo esto, qué conclusión saca de esta proteína?)
El programa motifScan nos permite acceder a distintas bases de datos desde las que identificar los diferentes motivos de nuestra proteína.
Los distintos motivos quedan recogidos en el siguiente mapa:
A continuación, se encuentra una vista más detallada de los mismos. El orden se corresponde con el mostrado en el mapa.
Hidrofobicidad
Para calcular este parámetro, utilizamos el programa Protscale., el cual te permite calclar y representar el perfil producido por cualquier "escala de aminoácidos" en la proteína seleccionada. Una escala de aminoácido se define por un valor numérico asignado a cada aminoácido. En nuestro caso, utilizamos la escala de hidrofobicidad de Kyte & Doolittle.Los valores de los aminoácidos son los que siguen:
Reprentación de la escala de hidrofobicidad de Kyte & Doolittle:
Familia
Según de que fuente obtengamos la secuencia, el programa Pfam nos da un resultado u otro. Con la secuancia de aminoácidos obtenida con el ARTEMIS, el Pfam no encuentra ninguna familia (eso es la prueba de que no ha utilizado bien Arttemis y ha elegido un ORF no correcto) . Si tomamos el prouct génico desde lso resultados del ncbi, obtenemos que pertenece a la "FAD binding domain".Esta familia incluye las subunidades flavoproteina de las fumarato y succinato deshidrogenasa, aspartato oxidasa y la subunidad alfa de la adenililsulfato reductasa.
En bacterias hay 2 grupos diferenciados; proteínas unidas a membrana y complejos enzimaticos responsables de la interconversión de fumarato y succinato: fumarato reductasa (Frd), usada en el crecimiento anaeróbico, y la succinato deshidrogenasa (Sdh), usada en el crecimiento aeróbico. Ambos complejos están formados por dos componentes principales: un componente extrínseco de membrana, compuesto por una flavoproteína de unión al FAD y un proteína de hierro-azufre; y un componente hidrofóbico compuesto de una proteína de anclaje a la membrana y/o un citocromo B.
La subunidad flavoproteína es una proteina de unos 60 a 70 kd, en la cual el FADestá unido covalentmente a un residuo de histidina localizado en la sección N-terminal de la proteína PUBMED:2668268.La secuencia de los alrededores de la histidina esá bien conservada en Frd y Sdh en numerosas especias bacterianas y eucariotas PUBMED:1375942.
Esta familia es miembro del clan NADP_Rossmann (CL0063).
Localización celular
Para localizar nuestra proteína utilizamos el programa PsortB, obteniendo que es una proteína citoplasmática:
Localization Scores:
Cytoplasmic 8.87
CytoplasmicMembrane 0.39
Cellwall 0.01
Extracellular 0.73
Debido a sólo ha podido encontrar unas pocas regiones identificativas de la posición en nuestra secuencia, comprobaremos los resultados buscando posibles péptidos señal y dominios trasmembrana:
Péptido señal
El análisis lo hemos realizado online con el Signal 3.0. La primer gráfica corresponde a un análisis de "neural networks" (NN), y la segunda a "hidden Markov models" (HMM):
Dominios transmembrana
Como podíamos esperar, después de realizar el análisis, comprobamos que no posee dominios transmembrana, por lo que afirmamos que se trata de una proteína citoplasmática.
Mutagénesis in vitro del gen que codifica para la proteína elegida.
GCGCTTTCCGGTGGCGTCGAGCCACAGCGACGACGGGCCGGGGATGATCCGGATGGCGTG
CGCGAAAGGCCACCGCAGCTCGGTGTCGCTGCTGCCCGGCCCCTACTAGGCCTACCGCAC
ATCGGGCCAGATCGGGTCCCAGTTGACGATGCCCTCGGTGTAGTGCCACATGCGATCCCG
TAGCCCGGTCTAGCCCAGGGTCAACTGCTACGGGAGCCACATCACGGTGTACGCTAGGGC
GTTGACGATGTTGCCGCCCGCGTTCTCGGTGATCTCGAGCATGCGGCCGTCCACGTGCGC
CAACTGCTACAACGGCGGGCGCAAGAGCCACTAGAGCTCGTACGCCGGCAGGTGCACGCG
GGGCACGCCGGTGATCATGTGCTCGGGCACACGGCCCAGGCGGTCGACGGGCCAGTTCTT
CCCGTGCGGCCACTAGTACACGAGCCCGTGTGCCGGGTCCGCCAGCTGCCCGGTCAAGAA
CTTCACGAGGTCGGGGTTGCCGCCGATGCCGCCGGAGGTCACCACCACGGCCTGCGCGCG
GAAGTGCTCCAGCCCCAACGGCGGCTACGGCGGCCTCCAGTGGTGGTGCCGGACGCGCGC
GAGTTCGAACTCGCCGACGGGCGTGCGGGACGACTTCACGCCGCGCGGTTCGGTCGACGG
CTCAAGCTTGAGCGGCTGCCCGCACGCCCTGCTGAAGTGCGGCGCGCCAAGCCAGCTGCC
CTCGAGCACCGTGCCGCGCACCCCCACGGCGGCGCCGTTCTCGACGATCAGATCGTCCAC
GAGCTCGTGGCACGGCGCGTGGGGGTGCCGCCGCGGCAAGAGCTGCTAGTCTAGCAGGTG
CTGGTGCCGGTATCGGAAGGTGACCTGTCCGCGGGCGGCGGCGTCGAGCACCGGTTCGCG
GACCACGGCCATAGCCTTCCACTGGACAGGCGCCCGCCGCCGCAGCTCGTGGCCAAGCGC
GAACACCCGGACCACTTCCGGTCCCGTGCCCCACGTGATGTGGAAGCGCGGTACCGAATT
CTTGTGGGCCTGGTGAAGGCCAGGGCACGGGGTGCACTACACCTTCGCGCCATGGCTTAA
TCCGTGACCGGTGGCCAGCCCACCGCCGCGTTCGGCCCAGCCGACGTTCGGCATCACGCG
AGGCACTGGCCACCGGTCGGGTGGCGGCGCAAGCCGGGTCGGCTGCAAGCCGTAGTGCGC
CAGGCCGAGGTCGTGCAGGTAGGCCCGCTTCTCGCCGGCCGCGAAGTCGACGTAGGCCTC
GTCCGGCTCCAGCACGTCCATCCGGGCGAAGAGCGGCCGGCGCTTCAGCTGCATCCGGAG
GGCCCACTGCCGGGGCCAACGGTCTTCGCGGTCGCGGTCGAATCCGGCGCTGCCCAGCCA
CCGGGTGACGGCCCCGGTTGCCAGAAGCGCCAGCGCCAGCTTAGGCCGCGACGGGTCGGT
GTCCTGCAGCGCCAGTTCACGGGAGTCCTTGATGCCCATGCGGCGCTGCTCGGGGCTGTC
CAGGACGTCGCGGTCAAGTGCCCTCAGGAACTACGGGTACGCCGCGACGAGCCCCGACAG
CACCAGGAACAGGCCGCCGAGTGA
GTGGTCCTTGTCCGGCGGCTCACT
Primer 1: GCGCTTTCCGGTGGCGTC
Primer 2: GGCCACTTCTTCTTCACGAG
Primer 3: CTCGTGAAGAAGAAGTGGCC
Primer 4: TCACTCGGCGGCCTGTTCCT
Realizamos la mutación en el codón GTT, que codifica para el aminoácido alifático Valina, sustituyendo la G por la C, por lo que ahora pasará a codificar para la leucina, otro aminoacido alifático. Hemos realizado una mutación conservativa utilizando primers que presentan "missmatch".
Diseño de primers para realizar fusiones génicas entre la proteína de interés con la proteína fluorescente verde para estudiar su localización celular o su concentración a lo largo del crecimiento del microorganismo.
GCGCTTTCCGGTGGCGTCGAGCCACAGCGACGACGGGCCGGGGATGATCCGGATGGCGTG
CGCGAAAGGCCACCGCAGCTCGGTGTCGCTGCTGCCCGGCCCCTACTAGGCCTACCGCAC
ATCGGGCCAGATCGGGTCCCAGTTGACGATGCCCTCGGTGTAGTGCCACATGCGATCCCG
TAGCCCGGTCTAGCCCAGGGTCAACTGCTACGGGAGCCACATCACGGTGTACGCTAGGGC
GTTGACGATGTTGCCGCCCGCGTTCTCGGTGATCTCGAGCATGCGGCCGTCCACGTGCGC
CAACTGCTACAACGGCGGGCGCAAGAGCCACTAGAGCTCGTACGCCGGCAGGTGCACGCG
GGGCACGCCGGTGATCATGTGCTCGGGCACACGGCCCAGGCGGTCGACGGGCCAGTTCTT
CCCGTGCGGCCACTAGTACACGAGCCCGTGTGCCGGGTCCGCCAGCTGCCCGGTCAAGAA
CTTCACGAGGTCGGGGTTGCCGCCGATGCCGCCGGAGGTCACCACCACGGCCTGCGCGCG
GAAGTGCTCCAGCCCCAACGGCGGCTACGGCGGCCTCCAGTGGTGGTGCCGGACGCGCGC
GAGTTCGAACTCGCCGACGGGCGTGCGGGACGACTTCACGCCGCGCGGTTCGGTCGACGG
CTCAAGCTTGAGCGGCTGCCCGCACGCCCTGCTGAAGTGCGGCGCGCCAAGCCAGCTGCC
CTCGAGCACCGTGCCGCGCACCCCCACGGCGGCGCCGTTCTCGACGATCAGATCGTCCAC
GAGCTCGTGGCACGGCGCGTGGGGGTGCCGCCGCGGCAAGAGCTGCTAGTCTAGCAGGTG
CTGGTGCCGGTATCGGAAGGTGACCTGTCCGCGGGCGGCGGCGTCGAGCACCGGTTCGCG
GACCACGGCCATAGCCTTCCACTGGACAGGCGCCCGCCGCCGCAGCTCGTGGCCAAGCGC
GAACACCCGGACCACTTCCGGTCCCGTGCCCCACGTGATGTGGAAGCGCGGTACCGAATT
CTTGTGGGCCTGGTGAAGGCCAGGGCACGGGGTGCACTACACCTTCGCGCCATGGCTTAA
TCCGTGACCGGTGGCCAGCCCACCGCCGCGTTCGGCCCAGCCGACGTTCGGCATCACGCG
AGGCACTGGCCACCGGTCGGGTGGCGGCGCAAGCCGGGTCGGCTGCAAGCCGTAGTGCGC
CAGGCCGAGGTCGTGCAGGTAGGCCCGCTTCTCGCCGGCCGCGAAGTCGACGTAGGCCTC
GTCCGGCTCCAGCACGTCCATCCGGGCGAAGAGCGGCCGGCGCTTCAGCTGCATCCGGAG
GGCCCACTGCCGGGGCCAACGGTCTTCGCGGTCGCGGTCGAATCCGGCGCTGCCCAGCCA
CCGGGTGACGGCCCCGGTTGCCAGAAGCGCCAGCGCCAGCTTAGGCCGCGACGGGTCGGT
GTCCTGCAGCGCCAGTTCACGGGAGTCCTTGATGCCCATGCGGCGCTGCTCGGGGCTGTC
CAGGACGTCGCGGTCAAGTGCCCTCAGGAACTACGGGTACGCCGCGACGAGCCCCGACAG
CACCAGGAACAGGCCGCCGAGTGA
GTGGTCCTTGTCCGGCGGCTCACT
Secuencia del gen GFP
ATGAGTAAAGGAGAAGAACTTTTCACTGGAGTTGTCCCAATTCTTGTTGAATTAGATGGTGATGTTAATG 0
TACTCATTTCCTCTTCTTGAAAAGTGACCTCAACAGGGTTAAGAACAACTTAATCTACCACTACAATTAC 0
GGCACAAATTTTCTGTCAGTGGAGAGGGTGAAGGTGATGCAACATACGGAAAACTTACCCTTAAATTTAT 70
CCGTGTTTAAAAGACAGTCACCTCTCCCACTTCCACTACGTTGTATGCCTTTTGAATGGGAATTTAAATA 70
TTGCACTACTGGAAAACTACCTGTTCCATGGCCAACACTTGTCACTACTTTCGGTTATGGTGTTCAATGC 140
AACGTGATGACCTTTTGATGGACAAGGTACCGGTTGTGAACAGTGATGAAAGCCAATACCACAAGTTACG 140
TTTGCGAGATACCCAGATCATATGAAACAGCATGACTTTTTCAAGAGTGCCATGCCTGAAGGTTATGTAC 210
AAACGCTCTATGGGTCTAGTATACTTTGTCGTACTGAAAAAGTTCTCACGGTACGGACTTCCAATACATG 210
AGGAAAGAACTATATTTTTCAAAGATGACGGGAACTACAAGACACGTGCTGAAGTCAAGTTTGAAGGTGA 280
TCCTTTCTTGATATAAAAAGTTTCTACTGCCCTTGATGTTCTGTGCACGACTTCAGTTCAAACTTCCACT 280
TACCCTTGTTAATAGAATCGAGTTAAAAGGTATTGATTTTAAAGAAGATGGAAACATTCTTGGACACAAA 350
ATGGGAACAATTATCTTAGCTCAATTTTCCATAACTAAAATTTCTTCTACCTTTGTAAGAACCTGTGTTT 350
TTGGAATACAACTATAACTCACACAATGTATACATCATGGCAGACAAACAAAAGAATGGAATCAAAGTTA 420
AACCTTATGTTGATATTGAGTGTGTTACATATGTAGTACCGTCTGTTTGTTTTCTTACCTTAGTTTCAAT 420
ACTTCAAAATTAGACACAACATTGAAGATGGAAGCGTTCAACTAGCAGACCATTATCAACAAAATACTCC 490
TGAAGTTTTAATCTGTGTTGTAACTTCTACCTTCGCAAGTTGATCGTCTGGTAATAGTTGTTTTATGAGG 490
AATTGGCGATGGCCCTGTCCTTTTACCAGACAACCATTACCTGTCCACACAATCTGCCCTTTCGAAAGAT 560
TTAACCGCTACCGGGACAGGAAAATGGTCTGTTGGTAATGGACAGGTGTGTTAGACGGGAAAGCTTTCTA 560
CCCAACGAAAAGAGAGACCACATGGTCCTTCTTGAGTTTGTAACAGCTGCTGGGATTACACATGGCATGG 630
GGGTTGCTTTTCTCTCTGGTGTACCAGGAAGAACTCAAACATTGTCGACGACCCTAATGTGTACCGTACC 630
ATGAACTATACAAATAA 717
TACTTGATATGTTTATT 717
Primer derecho: 5'- CCCAAGCTTGGG TCACTCGGCGGCCTGTTCCT (HindIlI)
Primer 1: 5'- CCCAAGCTTGGG ATG GCGCTTTCCGGTGGCGTC
Primer 2: 5'- CTCCTTTACTCATCTCGGCGGCC
Primer 3: 5'- GGCCGCCGAGATGAGTAAAGGAG
Primer 4: 5'- AACTGCAGAACCAATGCATTGG AATAAACATATCAAGTAGGTACGG (PstI)
Nota: Las dianas de las enzimas de restricción se encuentras subrayadas y flanqueadas por las bases necesarias para que se produca el corte.
BIBLIOGRAFIA (no se puede escribir un trabajo en el 2009 usando una bibliografía anticuada) No ha utilizado los programas indicados para la bibliografía.
1. Goodfellow M, Alderson G (1977) The actinomycete-genus Rhodococcus: a home for the 'rhodochrous' complex. J. Gen. Microbiol. 100: 99-122.
2. Warhurst AM, Fewson CA (1994) Biotransformations catalyzed bythe genus hodococcus. Crit. Rev. Biotechnol. 14: 29-73.